检索结果

Select

1. 用于未对齐多模态语言序列情感分析的多交互感知网络

罗俊豪, 朱焱

《计算机应用》唯一官方网站 2024, 44 (1): 79-85. DOI: 10.11772/j.issn.1001-9081.2023060815

摘要（142）

HTML （6）

PDF （1299KB）（90）

针对现有对齐多模态语言序列情感分析方法常用的单词对齐方法缺乏可解释性的问题，提出了一种用于未对齐多模态语言序列情感分析的多交互感知网络（MultiDAN）。MultiDAN的核心是多层的、多角度的交互信息提取。首先使用循环神经网络（RNN）和注意力机制捕捉模态内的交互信息；然后，使用图注意力网络（GAT）一次性提取模态内及模态间的、长短期的交互信息；最后，使用特殊的图读出方法，再次提取图中节点的模态内及模态间交互信息，得到多模态语言序列的唯一表征，并应用多层感知机（MLP）分类获得序列的情感分数。在两个常用公开数据集CMU-MOSI和CMU-MOSEI上的实验结果表明，MultiDAN能充分提取交互信息，在未对齐的两个数据集上MultiDAN的F1值比对比方法中最优的模态时空注意图（MTAG）分别提高了0.49个和0.72个百分点，具有较高的稳定性。MultiDAN可以提高多模态语言序列的情感分析性能，且图神经网络（GNN）能有效提取模态内、模态间的交互信息。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 基于对比学习和GIF标记的多模态对话回复检索

黄懿蕊, 罗俊玮, 陈景强

《计算机应用》唯一官方网站 2024, 44 (1): 32-38. DOI: 10.11772/j.issn.1001-9081.2022081260

摘要（146）

HTML （4）

PDF （1653KB）（143）

社交媒体网站上使用GIF（Graphics Interchange Format）作为消息的回复相当普遍。但目前大多方法针对问题“如何选择一个合适的GIF回复消息”，没有很好地利用社交媒体上的GIF附属标记信息。为此，提出基于对比学习和GIF标记的多模态对话回复检索（CoTa-MMD）方法，将标记信息整合到检索过程中。具体来说就是使用标记作为中间变量，文本→GIF的检索就被转换为文本→GIF标记→GIF的检索，采用对比学习算法学习模态表示，并利用全概率公式计算检索概率。与直接的文本图像检索相比，引入的过渡标记降低了不同模态的异质性导致的检索难度。实验结果表明，CoTa-MMD模型相较于深度监督的跨模态检索（DSCMR）模型，在PEPE-56多模态对话数据集和Taiwan多模态对话数据集上文本图像检索任务的召回率之和分别提升了0.33个百分点和4.21个百分点。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

3. 基于BERT的不完全数据情感分类

罗俊, 陈黎飞

计算机应用 2021, 41 (1): 139-144. DOI: 10.11772/j.issn.1001-9081.2020061066

摘要（395）

PDF （921KB）（873）

不完全数据，如社交平台的互动信息、互联网电影资料库中的影评内容，广泛存在于现实生活中。而现有情感分类模型大多建立在完整的数据集上，没有考虑不完整数据对分类性能的影响。针对上述问题提出基于BERT的栈式降噪神经网络模型，用于面向不完全数据的情感分类。该模型由栈式降噪自编码器（SDAE）和BERT两部分组成。首先将经词嵌入处理的不完全数据输入到SDAE中进行去噪训练，以提取深层特征来重构缺失词和错误词的特征表示；接着将所得输出传入BERT预训练模型中进行精化以进一步改进词的特征向量表示。在两个常用的情感数据集上的实验结果表明，所提方法在不完全数据情感分类中的F1值和准确率分别提高了约6%和5%，验证了所提模型的有效性。

参考文献 | 相关文章 | 多维度评价

Select

4. 基于卷积神经网络的多尺度葡萄图像识别方法

邱津怡, 罗俊, 李秀, 贾伟, 倪福川, 冯慧

计算机应用 2019, 39 (10): 2930-2936. DOI: 10.11772/j.issn.1001-9081.2019040594

摘要（470）

PDF （1038KB）（362）

葡萄品种质量检测需要识别多类别的葡萄，而葡萄图片中存在多种景深变化、多串等多种场景，单一预处理方法存在局限导致葡萄识别的效果不佳。实验的研究对象是大棚中采集的15个类别的自然场景葡萄图像，并建立相应图像数据集Vitis-15。针对葡萄图像中同一类别的差异较大而不同类别的差异较小的问题，提出一种基于卷积神经网络（CNN）的多尺度葡萄图像识别方法。首先，对Vitis-15数据集中的数据通过三种方法进行预处理：旋转图像的数据扩增方法、中心裁剪的多尺度图像方法以及前两种方法的数据融合方法；然后，采用迁移学习方法和卷积神经网络方法来进行分类识别，迁移学习选取ImageNet上预训练的Inception V3网络模型，卷积神经网络采用AlexNet、ResNet、Inception V3这三类模型；最后，提出适合Vitis-15的多尺度图像数据融合的分类模型MS-EAlexNet。实验结果表明，在同样的学习率和同样的测试集上，数据融合方法在MS-EAlexNet上的测试准确率达到了99.92%，相较扩增和多尺度图像方法提升了近1个百分点，并且所提方法在分类小样本数据集上具有较高的效率。

参考文献 | 相关文章 | 多维度评价

Select

5. 一种Linux网络硬件加密高性能并发调度方法

董贵山卢显良邓春梅罗俊

计算机应用

摘要（1508）

PDF （571KB）（1424）

结合生产者—消费者调度原理进行改进，针对Linux系统的网络数据硬件加密调度提出了一种将Linux网络协议栈与硬件加密调度紧密结合的并发调度方法——HENC。在生产者—消费者调度队列中增加了传送者指针，实现并通过测试数据验证了该高性能调度算法。通过与其他常用网络数据硬件加密调度方法的测试对比，说明了该算法的先进性，并进一步讨论了改进思路。